home *** CD-ROM | disk | FTP | other *** search
/ Developer CD Series 2000 January: Mac OS SDK / Dev.CD Jan 00 SDK2.toast / What's New / • What was new 11⁄99 / Technical Documentation / Misc Standards / Mac OS Text Encodings / SYMBOL.TXT < prev    next >
Encoding:
Text File  |  1999-09-24  |  15.0 KB  |  384 lines  |  [TEXT/MPS ]

  1. #=======================================================================
  2. #   FTP file name:  SYMBOL.TXT
  3. #
  4. #   Contents:       Map (external version) from Mac OS Symbol
  5. #                   character set to Unicode 2.1
  6. #
  7. #   Copyright:      (c) 1994-1999 by Apple Computer, Inc., all rights
  8. #                   reserved.
  9. #
  10. #   Contact:        charsets@apple.com
  11. #
  12. #   Changes:
  13. #
  14. #       b03  1999-Sep-22    Update contact e-mail address. Matches
  15. #                           internal utom<b3>, ufrm<b3>, and Text
  16. #                           Encoding Converter version 1.5.
  17. #       b02  1998-Aug-18    Encoding changed for Mac OS 8.5; add new
  18. #                           mapping from 0xA0 to EURO SIGN. Matches
  19. #                           internal utom<b3>, ufrm<b3>.
  20. #       n05  1998-Feb-05    Update to match internal utom<n5>, ufrm<n15>
  21. #                           and Text Encoding Converter version 1.3:
  22. #                           Use standard Unicodes plus transcoding hints
  23. #                           instead of single corporate characters, also
  24. #                           change mappings for 0xE1 & 0xF1 from U+2329
  25. #                           & U+232A to their canonical decompositions;
  26. #                           see details below. Also update header
  27. #                           comments to new format.
  28. #       n03  1995-Apr-15    First version (after fixing some typos).
  29. #                           Matches internal ufrm<n4>.
  30. #
  31. # Standard header:
  32. # ----------------
  33. #
  34. #   Apple, the Apple logo, and Macintosh are trademarks of Apple
  35. #   Computer, Inc., registered in the United States and other countries.
  36. #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
  37. #   throughout this document, "Macintosh" can be used to refer to
  38. #   Macintosh computers and "Unicode" can be used to refer to the
  39. #   Unicode standard.
  40. #
  41. #   Apple makes no warranty or representation, either express or
  42. #   implied, with respect to these tables, their quality, accuracy, or
  43. #   fitness for a particular purpose. In no event will Apple be liable
  44. #   for direct, indirect, special, incidental, or consequential damages 
  45. #   resulting from any defect or inaccuracy in this document or the
  46. #   accompanying tables.
  47. #
  48. #   These mapping tables and character lists are subject to change.
  49. #   The latest tables should be available from the following:
  50. #
  51. #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
  52. #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
  53. #
  54. #   For general information about Mac OS encodings and these mapping
  55. #   tables, see the file "README.TXT".
  56. #
  57. # Format:
  58. # -------
  59. #
  60. #   Three tab-separated columns;
  61. #   '#' begins a comment which continues to the end of the line.
  62. #     Column #1 is the Mac OS Symbol code (in hex as 0xNN)
  63. #     Column #2 is the corresponding Unicode or Unicode sequence
  64. #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
  65. #     Column #3 is a comment containing the Unicode name.
  66. #       In some cases an additional comment follows the Unicode name.
  67. #
  68. #   The entries are in Mac OS Symbol code order.
  69. #
  70. #   Some of these mappings require the use of corporate characters.
  71. #   See the file "CORPCHAR.TXT" and notes below.
  72. #
  73. #   Control character mappings are not shown in this table, following
  74. #   the conventions of the standard UTC mapping tables. However, the
  75. #   Mac OS Symbol character set uses the standard control characters
  76. #   at 0x00-0x1F and 0x7F.
  77. #
  78. # Notes on Mac OS Symbol:
  79. # -----------------------
  80. #
  81. #   The Mac OS Symbol encoding shares the script code smRoman
  82. #   (0) with the Mac OS Roman encoding. To determine if the Symbol
  83. #   encoding is being used, you must check if the font name is
  84. #   "Symbol".
  85. #
  86. #   Before Mac OS 8.5, code point 0xA0 was unused. In Mac OS 8.5
  87. #   and later versions, code point 0xA0 is EURO SIGN and maps to
  88. #   U+20AC (the Symbol font is updated for Mac OS 8.5 to reflect
  89. #   this). Note: U+20AC is new with Unicode 2.1; for earlier Unicode
  90. #   versions, Mac OS Symbol 0xA0 may be mapped to private-use
  91. #   character U+F8A0.
  92. #
  93. #   The layout of the Mac OS Symbol character set is identical to
  94. #   the layout of the Adobe Symbol encoding vector, with the
  95. #   addition of the Apple logo character at 0xF0.
  96. #
  97. #   This character set encodes a number of glyph fragments. Some are
  98. #   used as extenders: 0x60 is used to extend radical signs, 0xBD and
  99. #   0xBE are used to extend vertical and horizontal arrows, etc. In
  100. #   addition, there are top, bottom, and center sections for
  101. #   parentheses, brackets, integral signs, and other signs that may
  102. #   extend vertically for 2 or more lines of normal text. In general,
  103. #   Unicode does not encode such fragments, so these are mapping
  104. #   using corporate-zone Unicode characters (see below).
  105. #
  106. #   In addition, Symbol separately encodes both serif and sans-serif
  107. #   forms for copyright, trademark, and registered signs. Unicode
  108. #   encodes only the abstract characters, so one set of these (the
  109. #   sans-serif forms) are also mapped using corporate-zone Unicode
  110. #   characters (see below).
  111. #
  112. #   The following code points are unused, and are not shown here:
  113. #   0x80-0x9F, 0xFF.
  114. #
  115. # Unicode mapping issues and notes:
  116. # ---------------------------------
  117. #
  118. #   The goals in the mappings provided here are:
  119. #   - Ensure roundtrip mapping from every character in the Mac OS
  120. #     Symbol character set to Unicode and back
  121. #   - Use standard Unicode characters as much as possible, to
  122. #     maximize interchangeability of the resulting Unicode text.
  123. #     Whenever possible, avoid having content carried by private-use
  124. #     characters.
  125. #
  126. #   Some of the characters in the Mac OS Symbol character set do not
  127. #   correspond to distinct, single Unicode characters. To map these
  128. #   and satisfy both goals above, we employ various strategies.
  129. #
  130. #   a) If possible, use private use characters in combination with
  131. #   standard Unicode characters to mark variants of the standard
  132. #   Unicode character.
  133. #
  134. #   Apple has defined a block of 32 corporate characters as "transcoding
  135. #   hints." These are used in combination with standard Unicode characters
  136. #   to force them to be treated in a special way for mapping to other
  137. #   encodings; they have no other effect. Sixteen of these transcoding
  138. #   hints are "grouping hints" - they indicate that the next 2-4 Unicode
  139. #   characters should be treated as a single entity for transcoding. The
  140. #   other sixteen transcoding hints are "variant tags" - they are like
  141. #   combining characters, and can follow a standard Unicode (or a sequence
  142. #   consisting of a base character and other combining characters) to
  143. #   cause it to be treated in a special way for transcoding. These always
  144. #   terminate a combining-character sequence.
  145. #
  146. #   The transcoding coding hints used in this mapping table are four
  147. #   variant tags, 0xF870-72 and 0xF87F. Since these are combined with
  148. #   standard Unicode characters, some characters in the Mac OS Symbol
  149. #   character set map to a sequence of two Unicodes instead of a single
  150. #   Unicode character.
  151. #
  152. #   For example, the Mac OS Symbol character at 0xE2 is an alternate,
  153. #   sans-serif form of the REGISTERED SIGN (the standard mapping is for
  154. #   the abstract character at 0xD2, which here has a serif form). So 0xE2
  155. #   is mapped to 0x00AE (REGISTERED SIGN) + 0xF87F (a variant tag).
  156. #
  157. #   b) Otherwise, use private use characters by themselves to map
  158. #   Mac OS Symbol characters which have no relationship to any standard
  159. #   Unicode character.
  160. #
  161. #   The following additional corporate zone Unicode characters are
  162. #   used for this purpose here:
  163. #
  164. #     0xF8E5  radical extender
  165. #     0xF8E6  vertical arrow extender
  166. #     0xF8E7  horizontal arrow extender
  167. #     0xF8F4  curly bracket extender
  168. #     0xF8FF  Apple logo
  169. #
  170. #   NOTE: The graphic image associated with the Apple logo character
  171. #   is not authorized for use without permission of Apple, and
  172. #   unauthorized use might constitute trademark infringement.
  173. #
  174. # Details of mapping changes in each version:
  175. # -------------------------------------------
  176. #
  177. #   Changes from version n05 to version b02:
  178. #
  179. #   - Encoding changed for Mac OS 8.5; 0xA0 now maps to 0x20AC, EURO
  180. #   SIGN. 0xA0 was unmapped in earlier versions.
  181. #
  182. #   Changes from version n03 to version n05:
  183. #
  184. #    - Change strict mapping for 0xE1 & 0xF1 from U+2329 & U+232A
  185. #     to their canonical decompositions, U+3008 & U+3009.
  186. #
  187. #   - Change mapping for the following to use standard Unicode +
  188. #     transcoding hint, instead of single corporate-zone
  189. #     character: 0xE2-0xE4, 0xE6-0xEE, 0xF4, 0xF6-0xFE.
  190. #
  191. ##################
  192.  
  193. 0x20    0x0020    # SPACE
  194. 0x21    0x0021    # EXCLAMATION MARK
  195. 0x22    0x2200    # FOR ALL
  196. 0x23    0x0023    # NUMBER SIGN
  197. 0x24    0x2203    # THERE EXISTS
  198. 0x25    0x0025    # PERCENT SIGN
  199. 0x26    0x0026    # AMPERSAND
  200. 0x27    0x220D    # SMALL CONTAINS AS MEMBER
  201. 0x28    0x0028    # LEFT PARENTHESIS
  202. 0x29    0x0029    # RIGHT PARENTHESIS
  203. 0x2A    0x2217    # ASTERISK OPERATOR
  204. 0x2B    0x002B    # PLUS SIGN
  205. 0x2C    0x002C    # COMMA
  206. 0x2D    0x2212    # MINUS SIGN
  207. 0x2E    0x002E    # FULL STOP
  208. 0x2F    0x002F    # SOLIDUS
  209. 0x30    0x0030    # DIGIT ZERO
  210. 0x31    0x0031    # DIGIT ONE
  211. 0x32    0x0032    # DIGIT TWO
  212. 0x33    0x0033    # DIGIT THREE
  213. 0x34    0x0034    # DIGIT FOUR
  214. 0x35    0x0035    # DIGIT FIVE
  215. 0x36    0x0036    # DIGIT SIX
  216. 0x37    0x0037    # DIGIT SEVEN
  217. 0x38    0x0038    # DIGIT EIGHT
  218. 0x39    0x0039    # DIGIT NINE
  219. 0x3A    0x003A    # COLON
  220. 0x3B    0x003B    # SEMICOLON
  221. 0x3C    0x003C    # LESS-THAN SIGN
  222. 0x3D    0x003D    # EQUALS SIGN
  223. 0x3E    0x003E    # GREATER-THAN SIGN
  224. 0x3F    0x003F    # QUESTION MARK
  225. 0x40    0x2245    # APPROXIMATELY EQUAL TO
  226. 0x41    0x0391    # GREEK CAPITAL LETTER ALPHA
  227. 0x42    0x0392    # GREEK CAPITAL LETTER BETA
  228. 0x43    0x03A7    # GREEK CAPITAL LETTER CHI
  229. 0x44    0x0394    # GREEK CAPITAL LETTER DELTA
  230. 0x45    0x0395    # GREEK CAPITAL LETTER EPSILON
  231. 0x46    0x03A6    # GREEK CAPITAL LETTER PHI
  232. 0x47    0x0393    # GREEK CAPITAL LETTER GAMMA
  233. 0x48    0x0397    # GREEK CAPITAL LETTER ETA
  234. 0x49    0x0399    # GREEK CAPITAL LETTER IOTA
  235. 0x4A    0x03D1    # GREEK THETA SYMBOL
  236. 0x4B    0x039A    # GREEK CAPITAL LETTER KAPPA
  237. 0x4C    0x039B    # GREEK CAPITAL LETTER LAMDA
  238. 0x4D    0x039C    # GREEK CAPITAL LETTER MU
  239. 0x4E    0x039D    # GREEK CAPITAL LETTER NU
  240. 0x4F    0x039F    # GREEK CAPITAL LETTER OMICRON
  241. 0x50    0x03A0    # GREEK CAPITAL LETTER PI
  242. 0x51    0x0398    # GREEK CAPITAL LETTER THETA
  243. 0x52    0x03A1    # GREEK CAPITAL LETTER RHO
  244. 0x53    0x03A3    # GREEK CAPITAL LETTER SIGMA
  245. 0x54    0x03A4    # GREEK CAPITAL LETTER TAU
  246. 0x55    0x03A5    # GREEK CAPITAL LETTER UPSILON
  247. 0x56    0x03C2    # GREEK SMALL LETTER FINAL SIGMA
  248. 0x57    0x03A9    # GREEK CAPITAL LETTER OMEGA
  249. 0x58    0x039E    # GREEK CAPITAL LETTER XI
  250. 0x59    0x03A8    # GREEK CAPITAL LETTER PSI
  251. 0x5A    0x0396    # GREEK CAPITAL LETTER ZETA
  252. 0x5B    0x005B    # LEFT SQUARE BRACKET
  253. 0x5C    0x2234    # THEREFORE
  254. 0x5D    0x005D    # RIGHT SQUARE BRACKET
  255. 0x5E    0x22A5    # UP TACK
  256. 0x5F    0x005F    # LOW LINE
  257. 0x60    0xF8E5    # radical extender
  258. 0x61    0x03B1    # GREEK SMALL LETTER ALPHA
  259. 0x62    0x03B2    # GREEK SMALL LETTER BETA
  260. 0x63    0x03C7    # GREEK SMALL LETTER CHI
  261. 0x64    0x03B4    # GREEK SMALL LETTER DELTA
  262. 0x65    0x03B5    # GREEK SMALL LETTER EPSILON
  263. 0x66    0x03C6    # GREEK SMALL LETTER PHI
  264. 0x67    0x03B3    # GREEK SMALL LETTER GAMMA
  265. 0x68    0x03B7    # GREEK SMALL LETTER ETA
  266. 0x69    0x03B9    # GREEK SMALL LETTER IOTA
  267. 0x6A    0x03D5    # GREEK PHI SYMBOL
  268. 0x6B    0x03BA    # GREEK SMALL LETTER KAPPA
  269. 0x6C    0x03BB    # GREEK SMALL LETTER LAMDA
  270. 0x6D    0x03BC    # GREEK SMALL LETTER MU
  271. 0x6E    0x03BD    # GREEK SMALL LETTER NU
  272. 0x6F    0x03BF    # GREEK SMALL LETTER OMICRON
  273. 0x70    0x03C0    # GREEK SMALL LETTER PI
  274. 0x71    0x03B8    # GREEK SMALL LETTER THETA
  275. 0x72    0x03C1    # GREEK SMALL LETTER RHO
  276. 0x73    0x03C3    # GREEK SMALL LETTER SIGMA
  277. 0x74    0x03C4    # GREEK SMALL LETTER TAU
  278. 0x75    0x03C5    # GREEK SMALL LETTER UPSILON
  279. 0x76    0x03D6    # GREEK PI SYMBOL
  280. 0x77    0x03C9    # GREEK SMALL LETTER OMEGA
  281. 0x78    0x03BE    # GREEK SMALL LETTER XI
  282. 0x79    0x03C8    # GREEK SMALL LETTER PSI
  283. 0x7A    0x03B6    # GREEK SMALL LETTER ZETA
  284. 0x7B    0x007B    # LEFT CURLY BRACKET
  285. 0x7C    0x007C    # VERTICAL LINE
  286. 0x7D    0x007D    # RIGHT CURLY BRACKET
  287. 0x7E    0x223C    # TILDE OPERATOR
  288. #
  289. 0xA0    0x20AC    # EURO SIGN
  290. 0xA1    0x03D2    # GREEK UPSILON WITH HOOK SYMBOL
  291. 0xA2    0x2032    # PRIME    # minute
  292. 0xA3    0x2264    # LESS-THAN OR EQUAL TO
  293. 0xA4    0x2044    # FRACTION SLASH
  294. 0xA5    0x221E    # INFINITY
  295. 0xA6    0x0192    # LATIN SMALL LETTER F WITH HOOK
  296. 0xA7    0x2663    # BLACK CLUB SUIT
  297. 0xA8    0x2666    # BLACK DIAMOND SUIT
  298. 0xA9    0x2665    # BLACK HEART SUIT
  299. 0xAA    0x2660    # BLACK SPADE SUIT
  300. 0xAB    0x2194    # LEFT RIGHT ARROW
  301. 0xAC    0x2190    # LEFTWARDS ARROW
  302. 0xAD    0x2191    # UPWARDS ARROW
  303. 0xAE    0x2192    # RIGHTWARDS ARROW
  304. 0xAF    0x2193    # DOWNWARDS ARROW
  305. 0xB0    0x00B0    # DEGREE SIGN
  306. 0xB1    0x00B1    # PLUS-MINUS SIGN
  307. 0xB2    0x2033    # DOUBLE PRIME    # second
  308. 0xB3    0x2265    # GREATER-THAN OR EQUAL TO
  309. 0xB4    0x00D7    # MULTIPLICATION SIGN
  310. 0xB5    0x221D    # PROPORTIONAL TO
  311. 0xB6    0x2202    # PARTIAL DIFFERENTIAL
  312. 0xB7    0x2022    # BULLET
  313. 0xB8    0x00F7    # DIVISION SIGN
  314. 0xB9    0x2260    # NOT EQUAL TO
  315. 0xBA    0x2261    # IDENTICAL TO
  316. 0xBB    0x2248    # ALMOST EQUAL TO
  317. 0xBC    0x2026    # HORIZONTAL ELLIPSIS
  318. 0xBD    0xF8E6    # vertical arrow extender
  319. 0xBE    0xF8E7    # horizontal arrow extender
  320. 0xBF    0x21B5    # DOWNWARDS ARROW WITH CORNER LEFTWARDS
  321. 0xC0    0x2135    # ALEF SYMBOL
  322. 0xC1    0x2111    # BLACK-LETTER CAPITAL I
  323. 0xC2    0x211C    # BLACK-LETTER CAPITAL R
  324. 0xC3    0x2118    # SCRIPT CAPITAL P
  325. 0xC4    0x2297    # CIRCLED TIMES
  326. 0xC5    0x2295    # CIRCLED PLUS
  327. 0xC6    0x2205    # EMPTY SET
  328. 0xC7    0x2229    # INTERSECTION
  329. 0xC8    0x222A    # UNION
  330. 0xC9    0x2283    # SUPERSET OF
  331. 0xCA    0x2287    # SUPERSET OF OR EQUAL TO
  332. 0xCB    0x2284    # NOT A SUBSET OF
  333. 0xCC    0x2282    # SUBSET OF
  334. 0xCD    0x2286    # SUBSET OF OR EQUAL TO
  335. 0xCE    0x2208    # ELEMENT OF
  336. 0xCF    0x2209    # NOT AN ELEMENT OF
  337. 0xD0    0x2220    # ANGLE
  338. 0xD1    0x2207    # NABLA
  339. 0xD2    0x00AE    # REGISTERED SIGN    # serif
  340. 0xD3    0x00A9    # COPYRIGHT SIGN    # serif
  341. 0xD4    0x2122    # TRADE MARK SIGN    # serif
  342. 0xD5    0x220F    # N-ARY PRODUCT
  343. 0xD6    0x221A    # SQUARE ROOT
  344. 0xD7    0x22C5    # DOT OPERATOR
  345. 0xD8    0x00AC    # NOT SIGN
  346. 0xD9    0x2227    # LOGICAL AND
  347. 0xDA    0x2228    # LOGICAL OR
  348. 0xDB    0x21D4    # LEFT RIGHT DOUBLE ARROW
  349. 0xDC    0x21D0    # LEFTWARDS DOUBLE ARROW
  350. 0xDD    0x21D1    # UPWARDS DOUBLE ARROW
  351. 0xDE    0x21D2    # RIGHTWARDS DOUBLE ARROW
  352. 0xDF    0x21D3    # DOWNWARDS DOUBLE ARROW
  353. 0xE0    0x22C4    # DIAMOND OPERATOR
  354. 0xE1    0x3008    # LEFT ANGLE BRACKET
  355. 0xE2    0x00AE+0xF87F    # REGISTERED SIGN, alternate (sans serif)
  356. 0xE3    0x00A9+0xF87F    # COPYRIGHT SIGN, alternate (sans serif)
  357. 0xE4    0x2122+0xF87F    # TRADE MARK SIGN, alternate (sans serif)
  358. 0xE5    0x2211    # N-ARY SUMMATION
  359. 0xE6    0x0028+0xF870    # LEFT PARENTHESIS, fragment (top)
  360. 0xE7    0x0028+0xF871    # LEFT PARENTHESIS, fragment (extender)
  361. 0xE8    0x0028+0xF872    # LEFT PARENTHESIS, fragment (bottom)
  362. 0xE9    0x005B+0xF870    # LEFT SQUARE BRACKET, fragment (top)
  363. 0xEA    0x005B+0xF871    # LEFT SQUARE BRACKET, fragment (extender)
  364. 0xEB    0x005B+0xF872    # LEFT SQUARE BRACKET, fragment (bottom)
  365. 0xEC    0x007B+0xF870    # LEFT CURLY BRACKET, fragment (top)
  366. 0xED    0x007B+0xF871    # LEFT CURLY BRACKET, fragment (center)
  367. 0xEE    0x007B+0xF872    # LEFT CURLY BRACKET, fragment (bottom)
  368. 0xEF    0xF8F4    # curly bracket extender
  369. 0xF0    0xF8FF    # Apple logo
  370. 0xF1    0x3009    # RIGHT ANGLE BRACKET
  371. 0xF2    0x222B    # INTEGRAL
  372. 0xF3    0x2320    # TOP HALF INTEGRAL
  373. 0xF4    0x222B+0xF871    # INTEGRAL, fragment (extender)
  374. 0xF5    0x2321    # BOTTOM HALF INTEGRAL
  375. 0xF6    0x0029+0xF870    # RIGHT PARENTHESIS, fragment (top)
  376. 0xF7    0x0029+0xF871    # RIGHT PARENTHESIS, fragment (extender)
  377. 0xF8    0x0029+0xF872    # RIGHT PARENTHESIS, fragment (bottom)
  378. 0xF9    0x005D+0xF870    # RIGHT SQUARE BRACKET, fragment (top)
  379. 0xFA    0x005D+0xF871    # RIGHT SQUARE BRACKET, fragment (extender)
  380. 0xFB    0x005D+0xF872    # RIGHT SQUARE BRACKET, fragment (bottom)
  381. 0xFC    0x007D+0xF870    # RIGHT CURLY BRACKET, fragment (top)
  382. 0xFD    0x007D+0xF871    # RIGHT CURLY BRACKET, fragment (center)
  383. 0xFE    0x007D+0xF872    # RIGHT CURLY BRACKET, fragment (bottom)    
  384.